【独家专访】百度孙勇义:开启人工智能新时代,做风口践行者
呼啸而至的2016资本寒冬下,人工智能市场逆流而上热潮涌动,在这个连接无处不在的世界中,互联网正在进入下一个重要风口——人工智能。尽管行业内部尚未确切将 2016 定为人工智能元年,但事实上这一年人工智能技术确实开始走向主流。而百度,站在行业破风手的位置也正在向这个风口加速奔跑着。
孙勇义
百度自动驾驶事业部工程副总经理
对此,本刊记者专访了百度自动驾驶事业部工程副总经理孙勇义,深入聆听百度在人工智能领域下的蓄势待发。
作为早已在人工智能领域耕耘多年的老将,百度在诸多方面所取得的重大突破不胜枚举。2016百度世界大会上,百度创始人兼CEO李彦宏首次向外界全面展示了百度人工智能核心——“百度大脑”,并宣布对广大开发者、创业者及传统企业开放其核心能力和底层技术。同样,孙勇义也向我们细致介绍了开放的百度大脑在语音、图像、自然语言处理、用户画像等四大领域的“超能力”,全方位多角度阐述人工智能带来的发展变革。
智能语音:语音主要包括语音识别技术、语音合成技术,广泛应用在手机百度、百度翻译、百度地图等实际软件操作中,2016年2月份,百度的语音识别系统Deep Speech2还被《MIT科技评论》评为2016十大突破技术。目前,百度大脑语音合成日请求量2.5亿,语音识别率达97%,强大的语音能力,将颠覆性改变人与设备的交互方式,语音技术的成熟也会加强物联网的智能化连接,通过语音指令进行直接操控,提升人们在移动时代的智能生活体验。
图像识别:在图像方面,百度大脑包括了OCR(图像文字识别)、无人车视觉以及时下异常火爆的AR等技术,其中,运用了图像识别技术的百度无人车在专为自动驾驶设定的KITTI测试中,车辆检测排名第一,在车辆跟踪的6项指标中取得过4项第一的佳绩。
自然语言处理:在孙勇义看来,自然语言处理技术可以说是目前行业的一个难点,谷歌、微软等人工智能领域的行业巨头都在加紧研发这一相关领域。2016年奥运会期间,嵌入这一技术的度秘便可智能解说篮球比赛,通过学习专业解说和评论,将枯燥的数据转化为轻松风格的解说语言,帮助观众更直观更全面的理解比赛。
用户画像:用户画像则是基于大数据和机器学习等技术,将拥有10亿月活量的百度产品积累的数据划分成不同维度的细分标签供行业、个性化应用。除此之外,百度大脑还延伸到了汽车、医疗领域,对其进行智能化改造升级。以汽车行业为例,搭载了汽车大脑的百度无人车现已在多项核心技术中处于世界领先地位,就在日前结束的世界互联网大会期间,百度的无人车在乌镇子夜路上完成了国内首次无人驾驶汽车开放城市道路运营和体验。
一直以来,行业内外致力于将人工智能真正服务于人类出行的研究项目不在少数,作为一个互联网公司,百度又为何会参与到汽车行业尤其是无人驾驶技术的深入研发呢?孙勇义表示:“创新,就像是流淌在百度人身体里的血液一样,点滴之行,凝聚成塔,最终形成了对技术的卓越创新、对研究的乐此不疲、对智能的痴心坚守。”创新、活力、坚持、勇气......这样的强势基因让百度在无人车领域攻克了一个又一个高地。
就技术领域来讲,百度无人车目前拥有环境感知、行为预测、规划控制、操作系统、智能互联、车载硬件、人机交互、高精定位、高精地图和系统安全等十项核心技术。截止到2016年7月底,百度自动驾驶技术专利的申请数量439项,包括无人车的智能感知与控制、智能检测与定位、高精地图等国际领先技术。
政府合作层面,百度得到了多方的大力支持,先后与安徽芜湖、上海国际汽车城、乌镇等政府方合作,共建无人车示范区、运营区;商业合作领域,百度与奇瑞、北汽、比亚迪等国内知名车企签订合作协议,针对无人车的研发展开深度合作;投资布局上,百度与硅谷知名激光雷达公司Velodyne LiDAR达成投资意向,未来两家公司将在自动驾驶领域开展多项深入合作,大幅度降低激光雷达的成本,推进百度无人车的商业化进程。
除此之外,百度自2015年12月完成了城市、环路及高速道路混合路况下的全自动驾驶后,2016年又在乌镇实现了首次开放城市道路运营和体验,孙勇义认为这次开放道路运营,很大程度上推进了无人驾驶从封闭研发测试环境走向公开运营环境的进程,未来也将有更多人切身感受到无人驾驶技术为生活出行带来的便利性及安全、环保、智能化生活水平等方面的巨大价值。
不管人工智能背后的技术原理多么复杂繁琐,但最终效力的发挥还是要归根于生活落地与实际应用,百度在2015年底时,便提出了“3年商用,五年量产”的目标,届时,将有更多的普通用户体验到无人车带来的便利化、安全化、智能化。
人工智能承载了中国众多产业的殷切希望,这一切绝对并非一个人、一个公司能够完成的,百度大脑作为百度人工智能的核心,也在以自己的优势所长努力着、进步着。
神经网络:百度拥有全球最大规模的,模拟人脑神经元组成的神经网络,但却比人脑的神经元数量多一个量级,支持万亿级参数、千亿样本、千亿特征训练。
服务器:数十万台服务器,以及国内最大的GPU集群,用于支持百度训练人工智能。
海量数据:在如今这个数据爆发的时代,掌握了数据对于训练人工智能来说是至关重要的。百度所拥有的海量数据,包括全网万亿网页、数十亿级搜索数据、百万级图像视频数据和百万级定位数据。
同时,孙勇义也对数据的重要价值做出了重点强调,“数据作为人工智能发展的主要因素,赋能价值远远超出认知想象,为了让机器越来越智能,我们需要不断的给予它‘知识’,而这些‘知识’就源于数据。”比如:训练汽车大脑,就需要给它人类驾驶的数据,以便充分掌握现有技能;训练语音识别能力,就需要给它大量的语料信息,以便更出色的完成任务。除此之外,算法和硬件能力同样至关重要,它们相当于人工智能的软件基础和硬件基础,光有数据远远不够,还需要有能够支撑这些海量数据运算的计算能力,以及学习方法。
人工智能的潜力与价值就像一个无底之洞,若想融入生活、融于实际,关键在于提供何种类型的数据,落地何种样式的产品。百度通过给予人工智能不同维度的数据,训练出了多种能力,并将这些能力用在了百度各个产品当中,无人车的落地是一种肯定,更是一种继续前进的动力。
第八届(2016-2017)虎啸奖奖项征集现已正式开启
报名请访问:http://case.hooxiao.com
扫数字营销杂志微信二维码
▼带你领略更多行业精彩▼
地址:江苏省南京市秦淮区石鼓路107号华威大厦20层E座
电话:025-84798505-8023 厉小姐